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三 维 灰 体 辐射 传递 系数 蒙特 卡 洛 的 GPU 计算 
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摘 要 : 为 了 计算 漫 反 射 灰 体 表面 之 间 的 辐射 传递 系数 ， 建 立 了 三 维 灰 立方 体 模型 ， 在 所 建立 的 三 维 立体 空间 内 表面 
选取 发 射 表面 ， 利 用 蒙特 卡 洛 方法 生成 发 射 光线 ， 并 对 光线 进行 光线 追踪 ， 计 算 发 射 表面 与 其 他 表面 之 间 的 辐射 传递 
系数 。 针 对 基于 蒙特 卡 洛 法 计算 三 维 灰 ee 数 时 耗 时 过 长 的 问题 , 进行 了 基于 显卡 GPU 实现 蒙特 卡 
洛 并 行 计算 的 研究 。 利 用 统一 编程 架构 CUDA 对 蒙特 卡 洛 法 进行 了 编程 实现 ， 采 用 CUDA 随机 数 发 生 算法 并 行 处 理 
了 求解 辐射 传递 系数 中 的 光线 追踪 过 程 ， 实 现 了 计算 辐射 传递 系数 的 并 行 方案 。 实 验 结 果 表 明 ， 相 对 于 CPU 串 行 计算 
方法 ， 基 于 CUDA 架构 的 并 行 蒙特 卡 洛 法 求解 辐射 传递 系数 可 以 取得 高 达 80 倍 的 计算 加 速 比 。 
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Monte Carlo for calculating radiative heat transfer coefficient of 3D gray body based on GPU 


Liu Shuo, Zhu Xian, Wang Zhangang, Li Fubing 
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China) 


Abstract: In order to calculate the radiative heat transfer coefficient between the diffuse surface of the 3D gray body, a cell cube 
model was setup to represent the gray surface, rays emitted 位 om one surface (i. e. , emission surface) are generated by using 
Monte Carlo method. Multiple reflections for each ray were being traced until it is totally absorbed. Energy absorbed at each 
ray-facet intersection is recorded to calculate the heat transfer coefficient between the emission surface and any other surface. 
To solve the over-consumption issue of radiative heat transfer coefficient based on Monte Carlo method between the diffuse 
surface of the 3D gray body, a Monte Carlo method based on GPU has been used to realize the parallel computation in this paper. 
Also in this paper, the unified programming architecture (CUDA) has been used to get the realization of programming the Monte 
Carlo method, according to the CUDA random number generation algorithm, the tracing process of the radiative transfer 
coefficient has been parallel computed, and a parallel scheme for calculating the radiative transfer coefficient has been realized. 
The experimental results show that, compared with the CPU serial calculation method, the parallel Monte Carlo method based 
on CUDA architecture can obtain the calculated acceleration ratio of 80 times as high as the radiative heat transfer coefficient. 
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0 引言 的 计算 。 蒙 特 卡 洛 方法 是 一 种 通过 随机 变量 的 统计 实验 来 求解 
数学 物理 或 工程 技术 问题 的 数值 方法 ， 已 有 上 百年 的 历史 ， 但 

众所周知 ,不 同 温度 的 物体 之 间 的 热量 传递 主要 通过 导热 、 期 由 于 模拟 实验 工具 的 限制 ， 真 正 用 于 解决 实际 问题 还 比较 

对 流 和 热 辐射 三 种 方式 来 实现 ， 尤 其 在 真空 中 ， 唯 一 可 以 依赖 。 少 争 。 近 二 十 多 年 来 , 在 实际 应 用 中 , 随 着 计算 机 的 高 速 发 展 ， 


的 换 热 方式 就 是 辐射 换 热 目 。 正 因为 如 此 ， 近 三 四 十 年 来 随 着 。 ”为 红外 辐射 特性 计算 的 三 维 建 模 方面 提供 了 有 利 条 件 。 与 


次 


里 论 与 实验 研究 受到 了 人 们 的 极 大 重视 ， 根 据 红 外 物理 理论 ; 步 用 于 辐射 换 热 问题 的 计算 。 


比 同 


箭 技术 、 人 造 卫 星 、 宇 宙 飞 船 和 核 工 业 的 发 展 ， 辐 射 换 热 的 时， 蒙特 卡 洛 法 在 现实 的 应 用 中 随 着 计算 机 的 高 速 发 展 ， 被 逐 


物体 之 间 辐 射 换 热 的 研究 最 重要 的 是 物体 之 间 的 辐射 传递 系数 蒙特 卡 洛 法 求解 表面 辐射 换 热 近年 来 得 到 了 广泛 的 应 
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文献 [3,4] 介 绍 了 在 辐射 换 热 领域 ， 蒙 特 卡 洛 法 求解 镶 射 换 热 是 二 
基于 概率 统计 理论 的 随机 抽样 方法 ， 利 用 重复 的 统计 实验 对 所 | 
研究 物理 或 数学 问题 进行 直接 或 间接 地 描述 ， 真 实 反映 事物 特 0 
点 和 物理 实验 过 程 。 文献 [5] 分 析 了 在 表面 热 辐射 间 题 中 蒙特 卡 WC 
治 法 求解 辐射 换 热 结果 的 精确 度 问题 ， 在 统计 实验 特别 大 时 ， | 
委 特 卡 洛 法 的 结果 误差 更 小 ， 给 出 了 蒙特 卡 洛 法 是 求解 纺 身 换 LM NA [一 
热 数 值 的 金 标准 。 文 献 [6] 中 根据 辐射 换 热 中 的 公式 法 ， 对 求解 
过 程 分 析 总 结 后 ， 提 出 了 漫 反射 辐射 界面 特性 的 单元 表面 之 间 图 1 三 维 灰 立 方 体内 表面 温 反 射 示意 区 
辐射 传递 系数 的 新 型 计算 方法 ， 并 且 与 蒙特 卡 洛 法 计算 结果 i 在 三 维 立体 的 表面 上 确定 了 发 射 点 后 ， 在 发 射 点 根据 蒙特 


进 
行 分 析 对 比 ， 间 接 证 明了 蒙特 卡 洛 法 的 精确 度 和 准确 性 ， 为 灰 。” 卡 洛 法 来 确定 随机 的 发 射 方向 : 在 发 射 点 所 在 的 表面 上 ， 利 用 
体 表面 之 间 的 辐射 传递 系数 的 研究 莫 定 了 结果 标准 。 该 表面 的 法 线 n 所 在 的 方向 作为 z 轴 正 方向 来 建立 该 表面 的 本 
随 着 计算 机 技术 的 发 展 ， 高 性 能 计算 速度 从 每 秒 百 万 次 浮 。 ” 体 坐 标 系 ， 在 该 表面 的 本 体 坐 标 系 中 ， 由 式 (2) 可 以 求 得 随机 发 
点 运算 提高 到 了 每 秒 干 万 亿 次 浮 点 运算 ， 在 三 维 建 模仿 真 、 软 。 射 方向 。 


硬件 技术 、 算 法 实现 和 计算 机 应 用 等 方面 都 得 到 了 巨大 的 发 展 。 i 
= aS1D 

充分 利用 GPU 硬件 资源 对 三 维 模型 建立 和 算法 进行 并 行 通用 sa O) 

计算 研究 是 一 个 热门 的 研究 方向 ， 所 以 近年 来 很 多 学 者 利用 oe 


GPU 实现 各 种 算法 和 三 维 模 型 仿真 。 文 献 [7，8] 提 出 了 蒙特 卡 。 其 中 : 6、 gy 分 别 为 发 射 光束 的 天 顶 角 和 方位 角 , Ro、Ro 为 [0,1] 
洛 法 可 并 行 化 进行 分 析 和 优化 ， 根 据 串 行 和 并 行 对 比 数值 实验 。 区 间 内 均匀 分 布 的 随机 数 。 

结果 ， 对 蒙特 卡 洛 法 的 并 行 结构 和 理论 提出 了 实现 方案 。 文 献 
[9~11] 进 行 了 蒙特 卡 洛 法 在 GPU 上 加 速 的 分 析 和 研究 ,在 高 性 
能 计算 领域 搭建 了 蒙特 卡 洛 法 框架 ， 实 现 了 蒙特 卡 洛 法 的 加 速 
计算 。 文 献 [12，13] 可 以 发 现在 GPU 架构 下 ， 提 出 了 蒙特 卡 洛 
算法 设计 和 对 算法 设计 进行 了 优化 分 析 ， 但 是 没有 实现 蒙特 卡 
洛 法 求解 辐射 传递 系数 。 


本 文 是 为 了 利用 蒙特 卡 洛 法 求解 三 维 单元 灰 立 方 体内 表面 
之 间 的 辐射 传递 系数 ， 建 立 了 三 维 红外 辐射 特性 横 型 ， 并 且 利 图 2 ”本体 坐标 系 中 的 发 射 方向 
用 CUDA 平台 ， 实 现 求解 辐射 传递 系数 的 蒙特 卡 洛 法 GPU 加 在 空间 三 维 立方 体 的 任意 六 个 表面 都 存在 六 个 不 同 的 本 体 
速 , 分 析 了 CUDA 平台 上 求解 辐射 传递 系数 的 效果 , 将 其 得 到 ”坐标 系 如 图 2 所 示 ， 因 此 在 立方 体 的 六 个 内 表面 的 本 体 坐 标 系 


的 效果 与 CPU 实现 蒙特 卡 洛 法 计算 结果 进行 对 比分 析 ; 利用 文 中， 利用 坐标 转换 矩阵 59， 将 本 体 坐 标 系 所 在 的 三 维 空间 半球 
献 [@] 中 新 型 的 求解 辐射 传递 系数 公式 法 所 得 结果 ， 与 本 文 内 的 发 射 方向 转换 到 参考 坐标 系 中 表示 ， 便 于 光线 追踪 计算 。 
CUDA 框架 下 所 得 结果 进行 准确 性 分 析 ; 最 后 本 文 对 GPU 加 ， 在 计算 三 维 灰 体 表面 的 辐射 传递 系数 时 ， 表 面向 所 在 半球 空间 
速 计算 效果 进行 了 研究 。 辐 射 传递 系数 应 用 于 计算 三 维 物体 表 发射 的 能 量 被 视 为 根据 公式 发 射 的 光线 的 能 量 和 。 假 定 发 射 表 
四 的 温度 分 布 ， 为 下 一 步 三 维 空间 红外 辐射 特性 建 模 、 计 算 三 。 面 发 出 光线 总 数 为 N， 每 条 光线 所 携带 的 能 量 为 


维 空间 物体 内 的 温度 分 布 和 辐射 换 热 的 精确 、 快 速 计 算 葛 定 重 _ (dao7’ @) 
要 的 参数 条 件 。 “TN 
TE 其 中 : 7 为 表面 的 瞬 态 温度 ，s 为 表面 的 反射 率 ，c 为 玻 尔 效 曼 
1 ”蒙特 卡 洛 法 计算 辐射 传递 系数 eh . ， 
蒙特 卡 洛 法 是 一 种 随机 模拟 和 统计 的 实验 方法 ， 本 文 利用 在 灰 体 表 面 ， 反 射 光 线 所 携带 的 能 量 依 表面 反射 率 s 而 衰 


蒙特 卡 洛 法 来 研究 三 维 灰 立方 体内 表面 之 间 的 辐射 传递 系数 ， 减 的 ， 如 图 1 所 示 ， 初 始 光 线 从 A 发 出 所 携带 能 量 为 e， 第 一 


光线 在 灰 体 表面 发 生 漫 反 射 ， 如 图 1 所 示 ， 漫 反射 首先 要 确定 。 次 到 达 表 面 M2 后 反射 光线 的 能 量变 为 se, 表面 M2 所 吸收 的 能 
发 射 表面 光束 发 射 的 位 置 和 发 射 的 方向 : 在 设 定 的 发 射 表面 Mi 量 为 (1-e) e。 然 后 在 该 表面 根据 上 文 的 蒙特 卡 洛 漫 反 射 原理 确 
上 根据 式 〈1) 随机 选取 一 个 发 射 点 A。 定 反 射 光 线 后 ， 到 达 Ms 进行 第 二 次 漫 反 射 ， 经 过 第 二 次 漫 反 
x= RR. 射 后 ， 反 射 能 量变 为 ee，Ms 所 吸收 的 能 量 为 (1-e) ee。 以 此 
y= R&R, (1) 类推， 第 K 次 漫 反射 的 反射 光线 能 量 为 sse。 给 定 阔 值 7， 当 反 
z=0 射 光线 的 能 量 ske 与 e 之 比 低 于 阔 值 7 即 可 视 为 光线 的 能 量 完 


出 


其 中 :”R:、R, 是 在 [0,1] 区 间 满 足 均 匀 分 布 的 随机 变量 。 全 被 立方 体 表 面 吸收 。 遍 历 入 条 发 射 光线 ， 统 计 每 个 反射 点 所 
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在 的 表面 的 能 量 ， 可 求 出 发 射 表面 对 其 他 表面 的 辐射 传递 系数 C rt 
为 : ” Y 

E. 
fF Re (4) CPU 三 维 灰 立方 体 建 模 
其 中 ，E; 为 发 射 表 面 1( 即 MD) 的 辐射 能 量 中 被 表面 i 吸收 的 部 v 
人 
分 ， 包 括 表 面 1 对 表面 i 直接 射 入 的 能 量 和 被 其 他 表面 反射 后 CPU 旗 义 红外 本 出 情 性 参 娄 
到 达 i 的 能 量 。 CPU 初 始 化 光线 总 数 及 能 
2 ”蒙特 卡 洛 法 的 CUDA 实现 SU 
(GPU 线 程 级 并 行 》 


2.1 CUDA 实现 蒙特 卡 洛 


CUDA 是 NVIDIA 公司 开发 的 并 行 计算 框架 。 开 发 者 通过 
CUDA 提供 的 虚拟 指令 可 以 使 用 并 行 计算 元 素 和 GPU 内 存 并 人 克制 尖 的 | ”| 可 匀 人 交 六 诺 囊 交 寺 
使 用 。 有 了 CUDA 的 支持 ， 开 发 者 可 以 像 使 用 CPU 一 样 方便 J J 
使 用 NVIDIA 公司 的 GPU。CUDA 采用 多 层次 的 存储 器 结构 ， 光线 追踪 光线 追踪 
用 C 语言 作为 程序 语言 , 如 图 3 所 示 CUDA 架构 模型 ,编程 
人 员 通 过 写 简单 的 GPU 内 核 程序 , 实现 并 行 计算 的 功能 , 一 个 光线 能 量 计算 光线 能 量 计算 


内 核 程序 可 以 被 多 个 线程 并 行 执行 。 多 个 线程 可 以 组 织 一 个 线 
程 块 ， 线 程 块 内 的 线程 共享 内 存 和 寄存 器 等 资源 。 多 个 线程 块 


组 成 一 个 内 核 网 格 ， 内 核 网 格 内 的 线程 块 间 相互 独立 地 并 行 执 表面 能 量 计 得 表面 能 量 计 算 
行 。 
块 网 格 Grid 光线 总 数 达 到 N 
ri 一 着 直下 
线程 块 Block(0,0) 线程 块 Block(1,0) (将 结果 拷贝 CPU J 是 
k 享 存储 器 k 享 存储 器 计算 发 射 表面 对 所 有 表面 
一 一 的 辐射 传递 系数 
| | 寄存 器 
| 三 结束 人 
线程 (0.0) | | 线程 (1,0) 线程 (0.0) || 线程 (1,0) wm 
图 4 CUDA 实现 蒙特 卡 洛 流程 图 
全 局 存储 器 2.2 CUDA 随机 数 发 生 器 
常数 存储 器 本 文通 过 蒙特 卡 洛 方法 ， 计 算 发 射 表 面 对 其 他 表面 的 辐射 
传递 系数 ， 每 条 发 射 光 线 的 位 置 和 方向 、 反 射 光线 的 方向 都 
图 3 CUDA 架构 模型 计算 机 随机 产生 ， 这 就 需要 一 个 高 效 的 随机 数 发 生 器 ， 而 使 用 


基于 CUDA 的 程序 计算 基本 步骤 为 : 首先 ， 分 别 在 GPU ” 该 随机 数 的 程序 段 运行 于 CUDA 设备 上 , 结合 求解 辐射 传递 系 


和 CPU 上 分 配 内 存 ， 在 Host 端 (CPU) 初 始 化 相关 数据 ， 其 次 ， 数 对 随机 数 均匀 性 的 要 求 , 如 何在 CUDA 设备 中 产生 快速 产生 
设置 grid 和 block 的 大 小 ， 在 Device 端 (GPU) 进 行 并 行 计 算 ; 随机 数 是 蒙特 卡 洛 法 的 实现 的 关键 。 
最 后 ， 当 计算 结果 满足 终止 准则 后 ， 将 数据 拷贝 到 Host 端 ， 得 根据 基本 的 数学 常识 : 常用 的 随机 数 概率 模型 有 三 种 ， 即 


到 最 终结 果 ,， 释放 GPU 和 CPU 的 内 存 。 本 文 根 据 CUDA 程序 。” 均匀 分 布 、 正 态 分 布 和 指数 分 布 模型 。 在 众多 的 随机 数 分 布 模 
计算 的 步骤 ， 对 蒙特 卡 洛 法 进行 实现 的 流程 如 图 4 所 示 。 首 先 。 型 中 ， 服 从 均匀 分 布 的 随机 数 是 基础 ， 其 他 概率 分 布 的 模型 都 
在 CPU 端 对 三 维 灰 体 进行 建 模 , 根据 红外 辐射 特性 , 定义 三 维 ”可 以 通过 均匀 分 布 的 随机 数 进行 一 定 的 函数 转换 而 得 到 05。 根 
灰 体 的 参数 ， 设 置 灰 体 表面 的 辐射 特性 参数 和 光线 总 数 ; 然后 据 图 4 蒙特 卡 洛 流程 图 可 以 发 现 :在 三 维 红外 辐射 特性 建 模 后 ， 
将 在 CPU 中 定义 大 量 的 数据 然后 传送 到 GPU 后 ,在 GPU 线 ”需要 在 CPU 中 产生 大 量 的 随机 数 然后 传送 到 GPU 中 ， 但 是 采 
程 中 实现 蒙特 卡 洛 法 的 红外 辐射 光线 的 一 系列 追踪 处 理 : 发 射 、 j 这 种 方式 来 处 理 这 部 分 随机 数 时 ，CPU 与 GPU 之 间 的 数据 
漫 反 射 、 求 交 、 光 线 追 踪 、 闵 值 判 断 和 能 量 计算 等 ， 计 算数 据 ”传输 和 读 取 操 作 的 时 间 开 销 代 价 太 大 。 
保存 三 维 灰 体 每 个 红外 辐射 灰 体 表面 所 吸收 光线 的 能 量 ， 最 丸 此 ， 本 文采 用 了 平方 取 中 算法 来 产生 均匀 随机 分 布 随 机 
后 ， 当 光线 总 数 满足 定义 要 求 后 ， 将 数据 结果 拷贝 至 CPU 中， ” 数 。 平 方 取 中 法 对 设置 的 随机 数 种 子 进行 平方 ， 去 掉 开始 的 几 
根据 式 (4) 得 到 灰 体 表面 之 间 的 辐射 传递 系数 。 位 ， 再 去 掉 结束 的 几 位 ， 剩 下 的 即 为 需要 的 随机 数 。 并 将 其 作 


i 


—~~ 
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为 随机 数 种 子 再 次 进行 同样 的 计算 ， 如 出 


列 的 随机 数 序列 ， 再 对 


内 的 标准 浮 点 数 。 本 文 为 实现 CUDA 设备 


程 号 、 


分 布 。 
2.3 ”光线 追踪 


循环 次 数 和 当前 时 间 的 乘积 作为 随机 数 种 子 ， 
同时 产生 随机 数 ， 这 样 所 有 的 线程 同时 产 4 


bt 反复 ， 就 得 到 了 一 系 
其 进行 归 一 化 处 理 ， 即 转换 为 [0,1] 区 间 


合 人 AAA | 
刘 ， 硕 ， 等 : 三 维 友 体 辐射 传递 系数 莹 特 卡 洛 的 GEU 计算 


维 灰 体 建 模 为 : 灰 体 立方 体 的 长 、 宽 、 高 都 设 为 1( 长 度 


光线 能 量 传输 是 蒙特 卡 洛 方法 的 基础 ， 单 条 光线 的 追踪 是 


利 ) 


蒙特 卡 洛 方法 对 辐射 换 热 问题 进行 求解 的 基本 单元 。 根 据 


蒙特 卡 洛 法 求解 辐射 传递 系数 的 原理 


如 图 


4 所 示 ， 


参数 后 ， 在 GPU 线程 并 行 实现 光线 的 
结合 以 上 蒙特 卡 洛 法 原理 


追踪 。 


与 CUDA 实现 方法 ， 如 图 


在 初始 化 


5 所 


示 ， 本 文 基于 CUDA 的 光线 追踪 
a) 在 GPU 端 对 变量 参数 进行 


据 基 本 的 数学 计算 ,求解 出 由 发 射 点 和 


行程 序 实现 的 详 
内 存 分 配 空间 ,利用 
机 数 发 生 器 在 设 定 的 发 射 表 面 生成 随机 发 射 点 和 发 身 


算法 : 


CUDA 随 
方向 ， 根 


发 射 方向 所 确定 的 射线 。 


吸收 的 能 量 和 光线 剩余 的 能 量 。 


b) 求 解 该 射线 与 三 维 立 方 体 的 交点 ， 计 算 该 交点 所 在 表 理 
若 光 线 剩余 的 外 


EE 
出 
a 


时 低 于 表面 吸 


时 不 低 于 表 国 


收 闵 值 ,光线 追踪 结束 。 若 光线 剩余 能 
在 交点 处 利用 


CUDA 随机 数 发 生 器 生成 随机 反射 


直至 光线 追踪 结束 。 
dd) 将 所 计算 的 表 
释放 GPU 内 存 空间 。 


GPU 端 分 配 


! 


CUDA 随 机 数 发 生 器 


y 
生成 随机 发 射 位 置 和 方向 


y 


一 无线 与 表面 "相交 
~ 
求 出 光线 与 表面 相交 的 交 
点 和 所 在 表面 编号 i 


9 由 交点 和 随机 反射 方向 确定 反射 射线 后 ， 重 复 


看 吸收 的 能 量 从 GPU 内 存 复制 到 主 存 中 ， 


吸收 羡 值 ， 
方向 。 


vy 
计算 表面 吸收 的 能 量 、 光 


生成 随机 反射 方向 


线 携带 剩余 能 量 ex 
了 人 
“一 | CUDA 随 机 数 发 4 


输出 结果 ， 释 放 GPU 内 存 空间 


图 5 蒙特 卡 洛 光线 追踪 流程 


E 器 


到 


3 ”实验 结果 与 分 析 
3.1 参数 设置 与 实验 环境 


本 文 的 实验 参数 设置 如 下 : 


单位 归 一 化 ); 根据 所 建立 的 灰 体 立方 体 设置 空间 坐标 系 ,x 轴 、 

FP 产生 随机 数 , 把 线 。 y 轴 和 = 轴 的 单位 长 度 按照 立方 体 的 归 一 单位 进行 划分 ;三 维 
多 个 线程 立体 内 表面 反射 率 c=0.8; 内 表面 吸收 阔 值 y=0.01; 在 空间 坐标 
的 随机 数 服 从 均匀 系 中 ， 三 维 立 体内 表面 的 编号 根据 内 表面 平面 所 在 的 表面 方程 


0、 =0、x=0、 J 二 1、x=1、z=1 依次 编号 为 1-6; 为 了 方便 研究 
以 及 分 析 实 验 结果 ， 本 文 设置 表面 1 号 即 平 面 方程 为 z=0 的 表 
面 为 光线 发 射 表面 。 三 维 灰 体内 表面 反射 率 和 光线 发 射 总 数 N 
根据 实验 内 容 要 求 设 定 光线 初始 携带 能 量 e=1。 

本 文 实验 的 硬件 平台 PC 机 , 2.60GHz Intel E5-2697 v3 CPU， 
256GB 内 存 和 NVIDIA Tesla K40c GPU。 软 件 环境 是 Windows 
7, Visual studio 2013, CUDA 8.0。 
3.2 ”实验 结果 分 析 

设 定 发 射 光线 总 数 N=105 时 ， 为 了 保证 结果 的 可 靠 性 ， 本 
文 将 程序 在 GPU 和 CPU 上 分 别 运 行 50 次 ， 取 实验 结果 的 平 
均值 作为 最 终结 果 ， 如 表 1 和 2 所 示 。 

表 1 CPU 计算 辐射 传递 系数 结 


表面 号 辐射 传递 系数 
1 0.045904 
2 0.191006 
3 0.184511 
4 0.191192 
5 0.190510 
6 0.190361 
表 2 GPU 计算 辐射 传递 系数 结果 
表面 号 辐射 传递 系数 
1 0.038394 
2 0.192314 
3 0.192216 
4 0.192268 
5 0.192118 
6 0.192407 
表 3 文献 [6] 新 型 公式 法 所 得 结果 
表面 号 辐射 传递 系数 
1 0.38461 
2 0.192304 
3 0.192306 
4 0.192310 
5 0.192313 
6 0.192305 


对 比 CPU 和 GPU 计算 结果 表明 : 表 3 为 文献 利用 辐射 能 
量 传递 过 程 的 分 解 求解 出 的 辐射 传递 系数 。 对 比 表 1、 表 2 和 
表 3 可 知 : 若 光 线 数量 足够 大 ， 利 用 蒙特 卡 洛 法 计算 辐射 传递 
系数 和 文献 中 按 解 方程 所 得 结果 数据 基本 一 致 ， 间 接 证 明了 文 
献 介绍 蒙特 卡 洛 法 是 计算 灰 体 表面 辐射 传递 系数 的 金 标准 ， 同 
时 ， 基 于 GPU 实现 蒙特 卡 洛 计算 辐射 传递 系数 与 CPU 实现 蒙 
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特 卡 洛 计算 具有 相同 的 结果 , 因此 , GPU 完全 可 以 代替 CPU 进 了 精确 快速 的 计算 参数 。 


行 基于 蒙特 卡 洛 法 计算 灰 体 表面 之 间 的 辐射 传递 系数 。 
辐 = 随 着 三 维 红外 建 模 技术 和 高 性 能 计算 技术 的 爆炸 式 发 展 ， 
| > 大 量 数据 的 处 理 对 实时 性 的 要 求 越 来 越 高 , 基于 CUDA 的 数据 
| A | 行 处 理 作为 一 种 有 效 提高 数据 处 理 速度 ， 提 高 应 用 系统 响应 
aa Re 实时 性 的 重要 技术 手段 得 到 了 广泛 应 用 。 在 辐射 传 热学 中 ， 三 
a 维 红外 辐射 特性 建 模 一 直 是 国内 外 研究 热点 ， 蒙 特 卡 洛 法 是 求 
ee 解 灰 体 表面 辐射 传递 系数 的 金 标准 ， 辐 射 传递 系数 是 计算 不 同 

| mm 温度 灰 体 表面 之 间 传递 能 量 和 辐射 换 热 的 重要 参数 ， 是 影响 和 

图 6 CPU 串 行 、CPU 并 行 和 GPU 并 行程 序 运行 时 间 究 三 维 物 体 红外 辐射 特性 的 关键 因素 。 
随 光线 数 变化 图 本 文 根 据 红外 辐射 特性 最 新 的 研究 发 展 需 要 ， 建 立 了 三 维 
分 别 设置 发 射 光线 总 数 为 105、2x105、3x105、4x105、5x105、 空间 灰 体 的 红外 辐射 特性 模型 ， 提 出 了 用 GPU 加 速 蒙特 卡 洛 


6x105、7x105、8x105、9x105 和 105，CPU 串 行 、CPU 并 行 和 ”法 的 架构 和 流程 , 实现 了 基于 CUDA 并 行 加 速 蒙特 卡 洛 法 计算 
GPU 并 行 对 蒙特 卡 洛 法 求解 辐射 传递 系数 求解 所 用 时 间 如 图 6 E 灰 体 表 面 之 间 的 辐射 传递 系数 。 结果 表 明 : 利用 GPU 加 速 
所 示 。 经 过 对 比 结果 表明 : 相 比 于 CPU 串 行 高 达 数 百 秒 的 计算 。 后 的 蒙特 卡 洛 法 计算 辐射 传递 系数 可 以 获得 特别 可 观 的 加 速 比 ， 
时 间 , 虽然 利用 CPU 多 核 并 行 处 理 蒙 特 卡 洛 法 的 运行 时 间 极 大 地 提高 了 求解 效率 ， 有 助 于 未 来 三 维 红外 辐射 特性 建 模 丰 
速 到 百 秒 内 , 取得 了 一 定 的 加 速效 果 。 但 是 采用 GPU 进行 并 行 ”” 究 ， 为 三 维 空间 物体 的 辐射 换 热 的 研究 披 上 了 高 性 能 计算 的 儿 
计算 时 ， 计 算 时 间 一 直 在 5s 内 ， 相 比 CPU 多 核 并 行 处 理 ， 更 衣 ， 开 辟 了 红外 物理 的 辐射 特性 计算 加 速 基础 。 
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